产品战略专家梁宁确认出席AICon北京站,分享AI时代下的商业逻辑与产品需求 了解详情
写点什么
Mooncake 分离式推理架构创新与实践
Mooncake 分离式推理架构创新与实践

月之暗面推理系统负责人何蔚然从实际业务出发,讲述了在固定集群资源的条件下,通过采用单点和分布式推理架构,提升集群处理大规模请求的能力的挑战和解决思路,希望能给大家带来一些帮助。

知名 UP 主被锤用开源项目“伪装原创”,原作者越南 AI 工程师愤怒维权,网友:把收益赔给他!
知名 UP 主被锤用开源项目“伪装原创”,原作者越南 AI 工程师愤怒维权,网友:把收益赔给他!

违反开源许可的事情,在技术圈内屡见不鲜,但这种行为一旦被揭露,往往会引发轩然大波。

12亿融资撑腰,国内这颗具身智能赛道最亮的新星凭什么抢占市场先机?
12 亿融资撑腰,国内这颗具身智能赛道最亮的新星凭什么抢占市场先机?

在产品的商业化探索方面,银河通用进展迅速。已经和美团、奔驰、极氪等行业内头部企业开展合作。

3.76万亿元背后,开发者真的能拿到95%吗?苹果罕见披露中国开发者收入情况
3.76 万亿元背后,开发者真的能拿到 95% 吗?苹果罕见披露中国开发者收入情况

超过 95% 的营业额与销售额完全归开发者所有,不需支付苹果任何佣金。  

“为什么说大模型可能是软件开发的死胡同?”
“为什么说大模型可能是软件开发的死胡同?”

“ LLM 作为服务被引入产品的前景不大,除非 LLM 本身就是产品。”

营收翻倍、Blackwell芯片爆单,黄仁勋否认 Scaling Law 失效,但英伟达财报后股价还是跌了
营收翻倍、Blackwell 芯片爆单,黄仁勋否认 Scaling Law 失效,但英伟达财报后股价还是跌了

“在 Blackwell 开始量产时,毛利率将在 70% 出头”

Anthropic 工程师关于提示词工程的深入探讨
Anthropic 工程师关于提示词工程的深入探讨

提示词工程(Prompt Engineering)是与大语言模型(LLM)交互的主要方式,旨在挖掘模型潜能并完成复杂任务。那么,究竟什么是提示词工程?它的发展历程、设计原则和未来趋势又是怎样的?

阿里云与清华大学共建AI大模型推理项目Mooncake正式开源
阿里云与清华大学共建 AI 大模型推理项目 Mooncake 正式开源

为了加速大模型推理技术的发展,特别是以 KVCache 为中心的缓存池化层的标准化,阿里云与清华大学深度共建 Mooncake 项目,结合主流大模型推理框架,抽象池化 KVCache 的底层接口,实现高效分布式 KVCache。

Kotlin HTTP Toolkit Ktor 3.0改进性能,并支持服务器发送事件
Kotlin HTTP Toolkit Ktor 3.0 改进性能,并支持服务器发送事件

Ktor 3.0 发布,采用 kotlinx-io 提升性能,支持服务器发送事件、CSRF 保护和从 ZIP 提供静态资源。Ktor 客户端支持 Wasm,但 Kotlin/Wasm 仍处于 Alpha 阶段。

共话AI与出海新趋势,技术领袖探讨未来发展之道
共话 AI 与出海新趋势,技术领袖探讨未来发展之道

技术正成为全球经济增长的新引擎。应用市场将经历过速启动期;以上。年突破千亿人民币市场规模。同时,随着“一带一路”倡议的深入推进,中国企业出海的步伐也在加快,特别是在数字经济领域,中国企业在全球市场的竞争力日益增强。

AI造脸“一眼真”,身份验证难上加难,技术可以用魔法打败魔法吗?
AI 造脸“一眼真”,身份验证难上加难,技术可以用魔法打败魔法吗?

生成式 AI 带来全新挑战,眼见不一定为真。

鸿蒙原生应用以“声”唤醒,解锁雅迪智能出行新体验
鸿蒙原生应用以“声”唤醒,解锁雅迪智能出行新体验

2024 年,随着华为的原生鸿蒙操作系统正式发布,雅迪积极响应并再次站在了智能出行的前沿,融合鸿蒙原生智能、原生易用创新特性,开发并上架了鸿蒙原生版雅迪智行 App。

InfoQ 独家对话 GMI Cloud 创始人:我看到的 GPU 云市场的现在和未来
InfoQ 独家对话 GMI Cloud 创始人:我看到的 GPU 云市场的现在和未来

近几年来,GPU 市场发生了巨大的变化。

英伟达 Blackwell 芯片又又又曝问题!老黄大半年没搞定,微软们被迫换货、换方案
英伟达 Blackwell 芯片又又又曝问题!老黄大半年没搞定,微软们被迫换货、换方案

英伟达下一代 Blackwell 芯片在高密度服务器机架中出现严重过热问题,导致设计变更和客户方面的部署延迟。

抖音爆款AI耳机、谷歌NotebookLM国内平替,声智科技亮相AICon大会揭秘其中玄机
抖音爆款 AI 耳机、谷歌 NotebookLM 国内平替,声智科技亮相 AICon 大会揭秘其中玄机

呈现 AI 产品交互的创新实践,并探讨 AI 声学硬件与 AI 应用交互的未来趋势与潜力。

Chrome被强制出售?谷歌或将抛弃ChromeOS全面转向Android系统
Chrome 被强制出售?谷歌或将抛弃 ChromeOS 全面转向 Android 系统

谷歌正在 Android 上重建 ChromeOS

到处都能刷到的 AI 视频,真没你想的那么简单
到处都能刷到的 AI 视频,真没你想的那么简单

火山引擎通过 BMF 框架和自研技术,解决 AI 视频生成中的成本、质量和性能问题,推动行业合作与开源共享。

谷歌云为 Valkey 和 Redis 集群的 Memorystore 添加了可扩展的向量搜索
谷歌云为 Valkey 和 Redis 集群的 Memorystore 添加了可扩展的向量搜索

本文提到了谷歌云 Memorystore 为 Valkey 和 Redis 集群新增向量搜索功能,支持数十亿向量超低延迟搜索,增强 AI 应用,可扩展至 250 个分片,支持混合查询。

红帽中国掌门人曹衡康:开源技术助力企业成长,AI应用场景探索正当时
红帽中国掌门人曹衡康:开源技术助力企业成长,AI 应用场景探索正当时

在当前的数字化转型浪潮中,AI 已经成为推动企业创新、提升竞争力的关键力量

独家|腾讯杰出科学家、混元大模型技术负责人之一刘威离职
独家|腾讯杰出科学家、混元大模型技术负责人之一刘威离职

“AI 的推理能力必须从被动推理变为主动推理。”

AI时代的数据底座,StarRocks 2024 年度技术峰会带你探索湖仓架构
AI 时代的数据底座,StarRocks 2024 年度技术峰会带你探索湖仓架构

阿里集团、Snowflake、腾讯音乐、小红书、Shopee 等 30+ 行业标杆企业联袂呈现,共话 AI 时代下的湖仓技术创新与未来

普林斯顿大学和耶鲁大学的研究人员发表《大语言模型的思维链推理分析》
普林斯顿大学和耶鲁大学的研究人员发表《大语言模型的思维链推理分析》

该研究显示了记忆和真实推理的证据。

企业如何利用AI技术加速数字化革新?华为云CIO领航班第二期给出答案
企业如何利用 AI 技术加速数字化革新?华为云 CIO 领航班第二期给出答案

11 月 15 日至 16 日,主题为“云端进化•智见未来”的华为云 CIO 领航班第二期在深圳和东莞举办,吸引了来自制造、零售、高科技等企业高管出席。围绕“产业数字化跃迁之路”、“AI 重塑千行万业”等议题以及华为的变革管理、华为研发工具链的实践经验,华为云与嘉宾深度交流并共同探讨了 AI 技术如何助力企业实现数字化升级,加速数字化转型的步伐。

PyTorch 2.5发布,支持英特尔GPU
PyTorch 2.5 发布,支持英特尔 GPU

该版本包含了自 PyTorch 2.4 以来的 4095 次提交。

儿歌点点携手火山引擎,共创儿童成长AI伙伴
儿歌点点携手火山引擎,共创儿童成长 AI 伙伴

随着人工智能时代的到来,儿歌点点正积极致力于探索 AI 技术与儿童启蒙的融合之道,旨在为孩子们提供更加个性化且丰富的内容资源以及更加多元有趣的互动体验。

微软和清华大学为 LLM 提出了 DIFF Transformer 架构
微软和清华大学为 LLM 提出了 DIFF Transformer 架构

微软 AI 和清华大学的研究人员提出了一种名为差分 Transformer(DIFF Transformer)的新架构,旨在提高大语言模型的性能。

生成式AI项目,数据管理的“坑”和“诀窍” |InfoQ《极客有约》
生成式 AI 项目,数据管理的“坑”和“诀窍” |InfoQ《极客有约》

生成式 AI 项目越来越多,数据管理的难度也跟着升级!怎样在合规和隐私保护的同时,保持高效?如何优化数据质量,让模型表现更靠谱?

Podman Desktop 1.13发布,支持Hyper-V
Podman Desktop 1.13 发布,支持 Hyper-V

Podman Desktop 1.13 发布,支持 Hyper-V 管理 Podman 机器,集成镜像搜索功能,更新空白状态页,优化 Kubernetes 导航,新增镜像层浏览器扩展,修复错误并提升用户体验。